# atc --framework=5 --model="./qwen2_dqsj.onnx"  --output="qwen2-0_5B_quant_dqsj" --input_format=ND --input_shape="input_ids:1,1;attention_mask:1,1025;position_ids:1,1;past_key_values:24,2,1,2,1024,64" --log=debug --soc_version=Ascend310B1 --precision_mode=must_keep_origin_dtype

atc --framework=5 --model="./qwen2_quant.onnx"  --output="qwen2-0_5B_quant" --input_format=ND --input_shape="input_ids:1,1;attention_mask:1,1025;position_ids:1,1;past_key_values:24,2,1,16,1024,64" --log=debug --soc_version=Ascend310B1 --precision_mode=must_keep_origin_dtype